| code | D1 | D2 |
|---|---|---|
| A | 1 | 48 |
| B | 17 | 90 |
| C | 22 | 6 |
| D | 26 | 70 |
| E | 48 | 31 |
| F | 52 | 54 |
| G | 56 | 67 |
| H | 58 | 50 |
| I | 72 | 18 |
| J | 76 | 86 |
| K | 78 | 39 |
| L | 99 | 16 |
Géometries de mondes abstraits
Régionalisation d’un semis de population en fonction d’une distance
INTRODUCTION
Objectif
Nous souhaitons montrer comment le choix d’une géométrie va influencer la perception des proximités entre des individus qui occupent des positions à l’intérieur d’un espace. Après avoir défini des distances entre les individus dans une géométrie, nous chercherons à définir des régions regroupant les individus de façon à maximiser un critère d’accessibilité défini comme suit
- les individus situés dans une même région doivent être le plus proche possibles
- les individus situés dans deux régions différentes doivent être le plus éloignés possibles
Il faudra donc définir une mesure de proximité \(D_{ij}\) entre les positions occupées par les individus puis choisir un critère à optimiser \(H(D,R)\). Mais on pourra également travailler sur l’ensemble des positions possibles (qu’elles soient ou non occupées par un individu) et définir une partition de l’ensemble de l’espace en fonction de la proximité des positions inoccupées avec les groupes d’indvidus établis au cours de la première étape de l’analyse.
Dispositif expérimental
On suppose que le monde est décrit par une ou plusieurs dimensions \(D_1, D_2, D_3, ...D_k\) qui définissent des positions pouvant être occupées par des individus \(i_1, ...i_n\) qui forment une population.
On suppose que chaque dimension comporte isolément 100 positions possibles que l’on peut noter de de 1 à 100. Lorsque l’on croise deux dimensions le nombre de position est multiplié et non pas additionné. Un espace à 2 dimensions offrira donc 10 000 positions et un espace à 3 dimensions 1 million de positions.
Nous nous limiterons dans notre analyse au cas des espaces à une ou deux dimensions et nous partirons systématiquement d’un même tableau de données composé de 12 individus et décrits par le tableau suivant :
La position D1 a été réalisée en effectuant un tirage uniforme aléatoire de 4 points entre 1 et 30, 4 points entre 41 et 60 et 4 points entre 71 et 100. Elle a donc exclu les positions \([31;40]\) et \([61 ; 70]\) du tirage au sort.
La position D2 a été en revanche construite par un tirage aléatoire uniforme sur l’ensemble de l’intervalle \([1;100]\)
A. MONDES UNIDIMENSIONNELS
A.1 Le monde est un segment …
Imaginons que le monde se réduise à une ligne comme la future ville de Neom en Arabie Saoudite
Données
On ne considère que la dimension D1 et on définit un segment de longueur 100 sur lequel se distribuent les 12 individus
| X | |
|---|---|
| A | 1 |
| B | 17 |
| C | 22 |
| D | 26 |
| E | 48 |
| F | 52 |
| G | 56 |
| H | 58 |
| I | 72 |
| J | 76 |
| K | 78 |
| L | 99 |
Visualisation
On peut visualiser facilement le résultat en adoptant une direction quelconque puisque notre ligne n’est pas orientée vers une direction particulière.
Distances
Dans notre monde linéaire on construite une distance \(D_{ij}\) qui sera par définition une fonction de la seule variable de localisation \(X_i\). Un choix évident est la différence en valeur absolue :
\(D_{ij} = |X_i - X_j|\)
Comme notre monde est fini on peut normaliser la distance sur l’intervalle \([0 ; 1]\) en divisant les valeurs de distance par la valeur maximale possible (de préférence à la valeur maximale observée).
\(D_{ij}^{norm} = |X_i - X_j|/ D_{max}\)
Le maximum possible étant pour nous égal ici à \(D_{max} = 100\), la matrice de distance se calcule sans difficultés avec la fonction dist()de R-base :
Dij = dist(coo,diag = T, upper = T,method = "euclidean")
Dij = Dij/100
kable(as.matrix(Dij),
caption = "Matrice de distance normalisée",
digits=2)| A | B | C | D | E | F | G | H | I | J | K | L | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| A | 0.00 | 0.16 | 0.21 | 0.25 | 0.47 | 0.51 | 0.55 | 0.57 | 0.71 | 0.75 | 0.77 | 0.98 |
| B | 0.16 | 0.00 | 0.05 | 0.09 | 0.31 | 0.35 | 0.39 | 0.41 | 0.55 | 0.59 | 0.61 | 0.82 |
| C | 0.21 | 0.05 | 0.00 | 0.04 | 0.26 | 0.30 | 0.34 | 0.36 | 0.50 | 0.54 | 0.56 | 0.77 |
| D | 0.25 | 0.09 | 0.04 | 0.00 | 0.22 | 0.26 | 0.30 | 0.32 | 0.46 | 0.50 | 0.52 | 0.73 |
| E | 0.47 | 0.31 | 0.26 | 0.22 | 0.00 | 0.04 | 0.08 | 0.10 | 0.24 | 0.28 | 0.30 | 0.51 |
| F | 0.51 | 0.35 | 0.30 | 0.26 | 0.04 | 0.00 | 0.04 | 0.06 | 0.20 | 0.24 | 0.26 | 0.47 |
| G | 0.55 | 0.39 | 0.34 | 0.30 | 0.08 | 0.04 | 0.00 | 0.02 | 0.16 | 0.20 | 0.22 | 0.43 |
| H | 0.57 | 0.41 | 0.36 | 0.32 | 0.10 | 0.06 | 0.02 | 0.00 | 0.14 | 0.18 | 0.20 | 0.41 |
| I | 0.71 | 0.55 | 0.50 | 0.46 | 0.24 | 0.20 | 0.16 | 0.14 | 0.00 | 0.04 | 0.06 | 0.27 |
| J | 0.75 | 0.59 | 0.54 | 0.50 | 0.28 | 0.24 | 0.20 | 0.18 | 0.04 | 0.00 | 0.02 | 0.23 |
| K | 0.77 | 0.61 | 0.56 | 0.52 | 0.30 | 0.26 | 0.22 | 0.20 | 0.06 | 0.02 | 0.00 | 0.21 |
| L | 0.98 | 0.82 | 0.77 | 0.73 | 0.51 | 0.47 | 0.43 | 0.41 | 0.27 | 0.23 | 0.21 | 0.00 |
Partition
Dans notre espace à une dimension, la variable \(X_i\) peut correspondre indifféremment à une position spatiale ou à un attribut statistique. Le choix d’une méthode de régionalisation revient donc ici à une simple classification visant à minimiser les distances intra-classes et maximiser les distances inter-classes. Il suffit donc d’appliquer un programme de classification pour obtenir une régionalisation de notre espace. On peut utiliser ici la procédure hclust de R-base
On décide par exemple de faire 3 classes et l’on retrouve sans surprise les groupes qui avaient été favorisés dans le tirage des valeurs de la dimension D1.
Densités
Plutôt que de fixer a priori le nombre de régions, on pourrait également raisonner sur la distribution des densités de points en fonction d’une fonction décroissante de la distance, ce qui permettra de repérer des pics de forte densité (“coeurs” des régions) et des bassins de faible densité (“marges” des régions).
Supposons par exemple que nous appliquions un voisinage gaussien de portée \(\mu\) c’est à dire
\(f(D_{ij}) = exp(- \alpha D_{ij}^2)\) avec \(\alpha = ln(0.5)/\mu^2\)
On peut alors voir comment le nombre de pics de densité diminue lorsque la portée de la fonction de voisinage augmente et comment on passe de 5 pics (\(\mu = 5\)) à deux pics (\(\mu = 10\)) et finalement un seul (\(\mu = 20\)).
Ce résultat très important montre que l’on peut construire un continuum de régionalisations en faisant varier le paramètre \(\mu\) pour une certraine famille de fonction de la distance et en examinant l’évolution de la distribution des pics et des creux d’accessibilité.
A.2 Le monde est un cercle …
Imaginons maintenant que le monde se réduit à une cercle autour d’une planète, comme dans le cas des anneaux de Saturne
Données
On transfrome les coordonnées de \(D_1\) en positions angulaires sur le cercle dans le sens trigonométrique \(\theta_1 ...\theta_{12}\) qui corresponde aux longitudes sur cette planète
| theta | |
|---|---|
| A | 3.6 |
| B | 61.2 |
| C | 79.2 |
| D | 93.6 |
| E | 172.8 |
| F | 187.2 |
| G | 201.6 |
| H | 208.8 |
| I | 259.2 |
| J | 273.6 |
| K | 280.8 |
| L | 356.4 |
Il s’agit apparemment de la même situation que précédemment (les valeurs de position angulaire \(\theta\) mesurées en degrés correspondent aux valeurs précédentes de X) mais la géométrie n’est plus la même ce qui change fondamentalement le calcul de distances.
Visualisation
Si l’on veut visualiser les points dans un espace à deux dimensions on peut les projeter, à la manière d’une carte du monde en projection polaire dont la longitude serait notre variable \(\theta\) et la latitude une constante égale à zéro correspondant à l’équateur. Si par exemple notre monde est une planète de rayon \(R\) = 1000 km, on aura
\(x_i = R \times cos(\theta_i)\)
\(y_i = R \times sin(\theta_i)\)
| x | y | |
|---|---|---|
| A | 998.02673 | 62.79052 |
| B | 481.75367 | 876.30668 |
| C | 187.38131 | 982.28725 |
| D | -62.79052 | 998.02673 |
| E | -992.11470 | 125.33323 |
| F | -992.11470 | -125.33323 |
| G | -929.77649 | -368.12455 |
| H | -876.30668 | -481.75367 |
| I | -187.38131 | -982.28725 |
| J | 62.79052 | -998.02673 |
| K | 187.38131 | -982.28725 |
| L | 998.02673 | -62.79052 |
Mais en réalité il est inutile d’introduire une projection dans un espace à deux dimensions si l’on supposer que les relations ne peuvent se faire qu’en circulant le long du cercle. La visualisation correcte de ce monde n’a donc pas besoin d’une échelle de distance mais plutôt d’une échelle angulaire.
Le changement de géométrie entraîne un rapprochement spectaculaire des points \(A\) et \(L\) qui étaient auparavant les deux points les plus éloignés dans le monde linéaire.
Distances
Dans notre monde circulaire, il n’est pas possible de se déplacer en ligne droite. Les distances correspondent donc aux trajets effectués surun arc de cercle ce qui donne une valeur maximale égale à \(\pi \times R\) avec \(R\) égal au rayon du cercle. On normalise par la distance maximale qui est égale à \(\pi R\) soit 3141.5 km dans notre exemple.
| A | B | C | D | E | F | G | H | I | J | K | L | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| A | 0.00 | 0.32 | 0.42 | 0.50 | 0.94 | 0.98 | 0.90 | 0.86 | 0.58 | 0.50 | 0.46 | 0.04 |
| B | 0.32 | 0.00 | 0.10 | 0.18 | 0.62 | 0.70 | 0.78 | 0.82 | 0.90 | 0.82 | 0.78 | 0.36 |
| C | 0.42 | 0.10 | 0.00 | 0.08 | 0.52 | 0.60 | 0.68 | 0.72 | 1.00 | 0.92 | 0.88 | 0.46 |
| D | 0.50 | 0.18 | 0.08 | 0.00 | 0.44 | 0.52 | 0.60 | 0.64 | 0.92 | 1.00 | 0.96 | 0.54 |
| E | 0.94 | 0.62 | 0.52 | 0.44 | 0.00 | 0.08 | 0.16 | 0.20 | 0.48 | 0.56 | 0.60 | 0.98 |
| F | 0.98 | 0.70 | 0.60 | 0.52 | 0.08 | 0.00 | 0.08 | 0.12 | 0.40 | 0.48 | 0.52 | 0.94 |
| G | 0.90 | 0.78 | 0.68 | 0.60 | 0.16 | 0.08 | 0.00 | 0.04 | 0.32 | 0.40 | 0.44 | 0.86 |
| H | 0.86 | 0.82 | 0.72 | 0.64 | 0.20 | 0.12 | 0.04 | 0.00 | 0.28 | 0.36 | 0.40 | 0.82 |
| I | 0.58 | 0.90 | 1.00 | 0.92 | 0.48 | 0.40 | 0.32 | 0.28 | 0.00 | 0.08 | 0.12 | 0.54 |
| J | 0.50 | 0.82 | 0.92 | 1.00 | 0.56 | 0.48 | 0.40 | 0.36 | 0.08 | 0.00 | 0.04 | 0.46 |
| K | 0.46 | 0.78 | 0.88 | 0.96 | 0.60 | 0.52 | 0.44 | 0.40 | 0.12 | 0.04 | 0.00 | 0.42 |
| L | 0.04 | 0.36 | 0.46 | 0.54 | 0.98 | 0.94 | 0.86 | 0.82 | 0.54 | 0.46 | 0.42 | 0.00 |
La distance maximale est alors observée entre des points situés à l’opposé l’un de l’autre sur le cercle comme A et D. Mais en revanche les points qui étaient auparavant très éloignés dans le monde du segment comme A et L sont désormais très proches dans le monde du cercle puisque celui-ci se referme à leur niveau.
Partition
Dans notre monde circulaire, la classification est très différente de celle observée dans le monde du segment alors même que les valeurs numériques sont au départ les mêmes. C’est la projection qui diffère.
On va retenir ici 4 classes
Densités
Comme dans le cas du monde linéaire, on peut tracer des courbes de densité paramétriques pour repérer les coeurs et les marges de notre espace. On utilise ici la méthode de lissage par kernel paramétrique (vonmises) du package circularavec des paramètres kappa de valeur 9 , 18 et 36.
On retouve la même méthode de calcul des densités que dans le monde linéaire, mais appliqué aux coordonnées angulaires. Mais avec une différence importante qui est ici la permanence de l’existence de 4 pics de densité aux différentes échelles de généralisation.
B. MONDES BIDIMENSIONNELS
B.1 Le monde est un échiquier
L’image la plus simple qui vienne à l’esprit lorsque l’on évoque un monde fini à deux dimensions est celle d’un échuiquier ou d’un damier. Comme nous avons introduit l’hypothèse que chaque individu occupait une position et que deux individus ne pouvaient pas occuper la même position, on peut définit des cases ou carreaux correspondant aux différentes positions autorisées. Le faite que ces carreaux soient de forme carrée n’est évidemment pas obligatoire (on aurait pu choisir des triangles ou des hexagone pour produire un pavage de l’espace) mais cela est suffisant dans un premier temps pour formuler quelques hypothèses sur les distances à l’intérieur de ce monde et cela permet de retrouver un certain nombre de métriques théoriques (euclidienne, Manhattan, Chebyshev, …) pour définir les distances entre les individus.
Données
On reprend telle quelle les données de position des dimensions D1 et D2 en soustrayant juste la valeur de 0.5 pour placer nos individus au centre des cases d’un échiquier formant un carré de dimension 100 x 100 avec un reprère orthonormé placé au point (0,0).
| X | Y | |
|---|---|---|
| A | 0.5 | 47.5 |
| B | 16.5 | 89.5 |
| C | 21.5 | 5.5 |
| D | 25.5 | 69.5 |
| E | 47.5 | 30.5 |
| F | 51.5 | 53.5 |
| G | 55.5 | 66.5 |
| H | 57.5 | 49.5 |
| I | 71.5 | 17.5 |
| J | 75.5 | 85.5 |
| K | 77.5 | 38.5 |
| L | 98.5 | 15.5 |
Visualisation
La visualisation est immédiate et facile, tous les logiciels de cartographie ou de statistique étant habitué à cette géométrie
B.2 Le monde est un disque
L’idée que le Monde soit un disque est une idée ancienne et même si la science a fini par l’infirmer elle demeure sans nul doute présente dans beaucoup de représentations contemporaines, propagées notamment par les théories du complot sur Youtube (Mohammed 2019). Il semble aussi que la conception d’une Terre plate soit une étape dans le dévloppement cognitif des enfants (Vaiopoulou et Papageorgiou 2018). Enfin, beaucoup de romans, notamment de science fiction ont utiliséce modèle pour construire des univers imaginaires, le plus célèbre étant sans doute celui des Annales du Disque Monde et la création annexe par l’auteur d’une série d’ouvrages portant sur la Science of Discworld (Stewart, Cohen, et Pratchett 2011) .
“The Disc, as it’s referred to in the novel, is quite literally a disc. The flat planet is carefully balanced on the backs of four elephants – Berilia, Tubul, Great T’Phon, and Jerakeen – who in turn stand on the Star Turtle, the Great A’Tuin, as it swims through space. […] Since the Disc is flat, there are no cardinal directions. Instead, the four directions are Hubwards (towards the Hub), Rimwards (towards the Rim), Turnwise (the direction that the Disc rotates in), and Widdershins (opposite to Turnwise). This leads to an endless onslaught of puns and geographical jokes. At the end of the book we discover the Circumfence, the rope fence that lines the edge of the Disc to help ensure no one falls off. There’s also the beauty of the Counterweight Continent – a land fabled to be made out of pure gold that exists to keep the Disc from tipping over. Everything we learn about the geography of Discworld is strangely cohesive while being entirely silly.” Source : Fernandez W., The Color of Magic, Consulté le 21/11/2024
Dans la perspective d’abstraction qui est la nôtre, un monde fini en forme de disque constitue un cas particulièrement intéressant puisque les positions peuvent y être mesurées par un jeu de coordonnées à la fois métrique et angulaire, ce qui revient en pratique à combiner les deux mondes vus précédemment : segment et cercle.
Données
On reprend les positions angulaires \(\theta_1 ...\theta_{12}\) issues de la variable D1 et on ajoute 12 coordonnées de rayon \(\rho_1 ...\rho_{12}\) qui mesurent la distance au centre. On fixe la distance maximale au centre à 1
| theta | rho | |
|---|---|---|
| A | 3.6 | 0.48 |
| B | 61.2 | 0.90 |
| C | 79.2 | 0.06 |
| D | 93.6 | 0.70 |
| E | 172.8 | 0.31 |
| F | 187.2 | 0.54 |
| G | 201.6 | 0.67 |
| H | 208.8 | 0.50 |
| I | 259.2 | 0.18 |
| J | 273.6 | 0.86 |
| K | 280.8 | 0.39 |
| L | 356.4 | 0.16 |
Visualisation
On peut propooser une visualisation planaire en projetant les coordonnées dans un espace euclidien à l’aide des formules de transformation des coordonnées polaires précédentes :
\(x_i = \rho_i \times cos(\theta_i)\)
\(y_i = \rho_i \times sin(\theta_i)\)
Mais en réalité, la propriété fondamentale d’un monde de ce type est qu’il n’existe pas de direction privilégiée de type “Nord”, “Sud”, “Est” ou “Ouest”. Il y a en revanche un centre et une périphérie (définis par la position sur la coordonnée sur \(\rho\)) et une direction de rotation qui suit le sens trignométrique (valeurs croissantes de \(\theta\)) ou le sens des aiguilles d’une montre (valeurs décroissantes de \(\theta\))
Distances
Dans le monde du disque il existe de très nombreuses possibilités de mesurer les distances, conduisant chacune à des formes différentes de regroupement des points en fonction de leur proximité. D’une manière générale on peut écrire :
\(D_{ij} = f(\rho_i, \theta_i, \rho_j, \theta_j)\)
On peut par exemple imaginer une décomposition additive de la fontion \(f\) en deux fonctions \(f_1, f_2, f_3\) telles que :
\(D_{ij} = f_1(\rho_i,\rho_j) + f_2(\theta_i, \theta_j)\)
On retrouve ainsi deux fonctions de distances classiques utilisées en géographie urbaine : la distance périphérique, la distance radiale:
La distance radiale fait l’hypothèse que tous les déplacements doivent passer par le centre du disque en suivant les radiales. Ce qui donne :
\(D_{ij}^{Rad} = \rho_i + \rho_j\)
La distance périphérique fait l’hypothèse que tous les déplacements dovent passer par la bordure externe du disque car le centre est saturé.
\(D_{ij}^{Cir} = (R - \rho_i)+ (R- \rho_j) + 2 \pi R \frac{|\theta_i-\theta_j|}{360}\)
La distance circumradiale correspond enfin au minimum de la distance radiale et de la distance périphérique, c’est à dire au choix du meilleur itinéraire entre deux options de passage soit par le centre, soit par la périphérie.
Essayons de la calculer pour voir à quelle matrice de distance elle aboutit.
| A | B | C | D | E | F | G | H | I | J | K | L | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| A | 0.48 | 0.69 | 0.27 | 0.59 | 0.40 | 0.51 | 0.58 | 0.49 | 0.33 | 0.67 | 0.44 | 0.32 |
| B | 0.69 | 0.10 | 0.48 | 0.48 | 0.60 | 0.72 | 0.78 | 0.70 | 0.54 | 0.88 | 0.64 | 0.53 |
| C | 0.27 | 0.48 | 0.06 | 0.38 | 0.18 | 0.30 | 0.36 | 0.28 | 0.12 | 0.46 | 0.22 | 0.11 |
| D | 0.59 | 0.48 | 0.38 | 0.30 | 0.50 | 0.62 | 0.69 | 0.60 | 0.44 | 0.78 | 0.54 | 0.43 |
| E | 0.40 | 0.60 | 0.18 | 0.50 | 0.31 | 0.43 | 0.49 | 0.41 | 0.24 | 0.58 | 0.35 | 0.23 |
| F | 0.51 | 0.72 | 0.30 | 0.62 | 0.43 | 0.46 | 0.52 | 0.52 | 0.36 | 0.70 | 0.47 | 0.35 |
| G | 0.58 | 0.78 | 0.36 | 0.69 | 0.49 | 0.52 | 0.33 | 0.48 | 0.43 | 0.76 | 0.53 | 0.42 |
| H | 0.49 | 0.70 | 0.28 | 0.60 | 0.41 | 0.52 | 0.48 | 0.50 | 0.34 | 0.68 | 0.44 | 0.33 |
| I | 0.33 | 0.54 | 0.12 | 0.44 | 0.24 | 0.36 | 0.43 | 0.34 | 0.18 | 0.52 | 0.29 | 0.17 |
| J | 0.67 | 0.88 | 0.46 | 0.78 | 0.58 | 0.70 | 0.76 | 0.68 | 0.52 | 0.14 | 0.44 | 0.51 |
| K | 0.44 | 0.64 | 0.22 | 0.54 | 0.35 | 0.47 | 0.53 | 0.44 | 0.29 | 0.44 | 0.39 | 0.28 |
| L | 0.32 | 0.53 | 0.11 | 0.43 | 0.23 | 0.35 | 0.42 | 0.33 | 0.17 | 0.51 | 0.28 | 0.16 |
Partition
L’arbre nous suggère 4 classes que l’on peut visualiser ainsi
L’image obtenu est de prime abord assez perturbante puisque des points qui nous semblent proches (en distance euclidienne) se retouvent en fait séparés dans des classes différentes et des points apparemment éloignés sont regroupés. La difficulté vient du fait que notre oeil regroupe de façon euclidienne alors que la distance qui est ici à l’oeuvre (circumradiale) opère différemment. Elle conduit en particulier à rapprocher les points localisés dans un même secteur angulaire c’est-à-dire ayant des valeurs proches de \(\theta\).
Densité
Le calcul des densités avec cette géométrie pour différentes portées de lissage est assez complexe ,